查看原文
其他

对象存储是医疗影像数据管理的更好选择(附视频)

谭啸 HIT专家网官微 2022-11-03

导读

对象存储适合海量、静态、非结构化、一次写入多次读取、改动不多、需要长期保存分析的数据。

“如何建好医学影像系统?首先要定义好医学影像为谁服务的问题,进而解决好临床、管理、质量、科研等多方面的关切问题。”9月16日,在由HIT专家网主办、日立数据(Hitachi Vantara)协办的“医疗影像数据中心建设趋势在线论坛”上,首都医科大学宣武医院信息中心主任梁志刚如此表示。
当前,医疗行业的非结构化影像数据呈指数级增长,公立医院绩效考核、互联网医院、集团化医院、医联体、医共体等,都对医疗数据的全面利用和共享提出了现实需求,日益丰富而开放的业务场景导致医疗影像数据的存储和调用特点各异,因此需要不断研判、统筹规划医疗影像数据的存储策略。

数据驱动时代,医疗影像数据面临诸多难题

“抗击疫情是医疗技术和信息技术的完美结合,疫情之后,医疗行业更加重视信息技术的应用。”日立数据中国区解决方案总监谢勇谈道,在新基建的宏观形势下,医疗信息化建设迎来新的历史发展机遇,医疗行业数字化转型加速。
2020年4月,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》发布,国家明确提出把数据作为生产要素。在这样的背景下,医疗行业正面临着数字化转型,医疗IT建设,要实现从系统到数据的转变。
谢勇认为,后疫情时代,医院信息部门的主要任务包括三方面:一是确保IT系统稳定运行,支撑医院各项医疗活动平稳开展;二是调整改造信息系统,满足新政策、法规、业务的IT需求;三是加快数据开放共享,发挥数据价值,促进医疗数字化转型。
在医疗数据中,医学影像数据无疑是个“重头戏”。作为曾经的放射科医生,梁志刚主任对此感受颇深,他认为,当前医学影像信息化建设面临如下一些问题,既有技术问题、管理问题,也有临床应用问题。
一是数据量巨大。宣武医院5年的医学影像在线数据量超过300TB,更大型医院的医学影像数据可达到PB级。
二是数据来源多样化,是多种模态的,磁共振、CT、DR、超声、核医学、内窥镜等都会产生医学影像。
三是涉及到多个管理部门和业务科室,工作协调困难。一多半的医技科室都与医学影像密切相关,如:放射科、介入科、超声科、内镜科、核医学科、病理科等。
四是数据用途多样。包括诊断级影像和后处理级影像,此外还要用于科研、教学、远程会诊等。
五是影像与患者利益相关性大,包含患者基本信息,对数据安全性要求较高,要做好安全保护和隐私保护。
六是数据应用与存储策略缺乏明确的标准。按照《医疗机构病历管理规定》,住院病历要保存30年,影像数据的存储年限并没有明确的标准,要存储30年是不现实的,不仅需要巨大的投入,也是资源的浪费。
首都医科大学附属北京友谊医院信息中心主任王力华同样关心影像数据的存储策略和标准问题,据王力华主任介绍,该院遗留了一批小容量存储系统,应用虚拟化之后,开始对存储进行整体规划,以减少管理的复杂性和资源的浪费。目前,该院有16套存储系统,其中8套已经接入虚拟化平台,总容量为600TB,年增长在50TB以上。目前,该院正在进行三个院区的整体规划。

如何建好医学影像系统?

如何建好医学影像系统?“先要定义好医学影像为谁服务的问题,毫无疑问是为医生和患者服务的。”梁志刚主任认为,医学影像系统要解决多个维度的关切问题。
首先要解决临床的关切:打通各个业务部门的壁垒,实现数据共享。首要任务是打破壁垒,把影像数据从生产环境中拿到信息中心,实现院级的数据共享和统一管理。这样也是有益于临床的,医生可以通过多种模态的影像,从多个维度对疾病进行观察研究和诊治。
其次要解决管理的关切:协同好信息、医政、临床、设备之间的关系。包括:医学影像设备的信息化管理措施,医学影像数据的压缩与否,医学影像显示设备的配置,医学影像后处理功能的应用,医学影像的存储策略,如存储时间、备份方案、是否上云等。
三是要解决质量的关切:加强数据治理,减少无效数据的产生。包括:影像扫描的策略、关键影像信息的管理采集、图像后处理、薄层或多序列影像的采集与存储等。PACS系统中存在大量垃圾数据,要从源头上解决数据质量问题。
四是要解决信息的关切:确保系统稳定性与业务连续性,保证数据安全,避免患者隐私泄露。如:业务需求整合、流程优化、部署方案、应急预案、数据导出管理、电子胶片或云存储的管理等。
五是解决研究者的关切:制定恰当的策略,为临床研究助力。对临床专家的科学研究而言,医学影像永远是不可或缺的一部分。包括:患者入组的流程,数据采集、传输与存储策略,科研数据共享的管理,数据安全性的管理,科研系统的部署与管理等。
关于医学影像大数据和人工智能的应用,梁志刚主任认为,医学影像可以产生大数据,但PACS系统保存的数据还不是大数据,因为PACS数据更多是诊断级别的数据,没有任何后处理和分析利用的价值,不是说建了PACS就有大数据了。
影像AI目前非常火,尤其是新冠肺炎疫情以来,有很多人工智能基于医学影像对新冠肺炎进行快速诊断,对此梁志刚主任的观点是“慎重利用”,因为有很多同病异影、异病同影的情况,即便是同一种疾病,与教科书中经典表现的一致性也不超过30%。

对象存储在医疗行业的四大应用场景

据谢勇介绍,从数据的角度看,医疗数据分为结构化数据和非结构化数据。
1.结构化数据:安全高效,闪存+双活。
结构化数据包括HIS、EMR以及虚拟机集群中的数据,其存储策略是安全高效。针对结构化数据,通常采用“闪存+双活”的解决方案,目前日立数据已有超过300个医疗行业的案例,该方案非常成熟稳定,可保证HIS和EMR的高可靠性。全闪存是降本增效的最佳手段,它在性能能耗、占地、故障率、综合成本等方面均有优势;双活解决方案则是提升系统可用性的最佳手段。
在结构化数据湖方面,某银行除生产中心(P-Vol)和灾备中心(异地S-Vol)外,还通过克隆/快照建立了T-Vol,可脱离生产系统做灾备系统、开发测试、数据备份和数据交互,非常方便和高效。
2.非结构化数据:灵活可控,对象存储。
非结构化数据包括档案、录音、视频、病理、PACS等,其存储策略是灵活可控,通常采用对象存储的解决方案。目前,对象存储已被互联网企业广泛应用,它适合海量、静态、非(半)结构化、一次写入多次读取、改动不多、需要长期保存分析的数据。PACS系统特别适合对象存储。
非结构化数据的对象存储数据湖示意图
非结构化数据湖是基于对象存储构建的。对象存储数据湖,与原有的PACS系统是解耦的,可以做审计查询、区域会诊、影响分析、移动访问等,适合未来发展。PACS数据可通过两种方式到达对象存储数据湖中:一是通过S3协议,目前很多主流的PACS厂商都支持S3协议;二是数据抽取
为什么对象存储更适合非结构化数据?在技术方面,“数据库+NAS”的效率较低,对象存储的密度较高;在TCO(总体拥有成本)方面,“数据库+NAS”要比对象存储高10倍。
对象存储在医疗行业将有四大应用场景:
一是非结构化数据湖。在线影像数据通常保存6-12个月,可让PACS系统实现数据瘦身,扩展成本低。影像数据湖与PACS之间解耦,可实现弹性自服务扩展,满足影像爆发式增长需求;影像长期保存,满足调阅和监管需求;实现影像统一管理和跨应用访问,更好支撑移动或跨区域的访问需求。
二是文件移动共享服务。只需一两个月就能实现从旧PACS向新PACS的迁移,以往通常需要几年时间才能完成。影像数据湖包括三方面的数据迁移:一是PACS数据库病历报告元数据迁移,二是影像文件迁移,三是影像自有元数据抽取。可实现全面的元数据整合。
三是云备份池。以前是备份到磁带库,对象存储可彻底解决磁带的痛点,可实现简单云管理、设备自更新、数据自保护、存储免备份。
四是日志审计分析、负载优化。可实现Hadoop Offloading,医院日志审计分析,独立扩展存储和计算。全面的数据保护、更好的整体拥有成本、随时随地数据访问。
由于影像数据增长特别快,医院存储的压力越来越大,王力华主任表示,正在考虑是否将影像数据放在云端,但还要对费用进行具体评估,因为很多方面(如安全)都需要单独付费。为此,谢勇对比分析了私有对象存储云和公有对象存储云:(1)私有对象存储云的优势是稳定、安全、可靠、密度高、维护简单、延迟低;(2)公有对象存储云的优势是部署快、灵活、敏捷、易于扩展;(3)公有云并不便宜,除了对存储空间进行收费外,还有数据流量费、请求次数费等;(4)混合云、多云是目前公认的云模式,不同应用选择不同的云模式。
总之,各种存储方式都有其优势和劣势,医疗机构需根据应用场景的需求,对成本、安全性、可用性、扩展性等因素进行综合考量,扬长避短。就医疗影像数据管理的特点和难点而言,对象存储是目前更好的选择。
(点击“阅读原文”观看视频回放)

近期热文
HIT专家网∣致力推进中国卫生信息化长按二维码可申请加入HIT专家网专业交流群投稿:gong_chen@HIT180.com

商务合作:(010)82373062

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存